엔비디아 테그라

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

엔비디아 테그라는 엔비디아가 개발한 시스템 온 칩(SoC) 제품군으로, 저전력 고성능 그래픽을 특징으로 한다. 2008년 APX 2500 발표를 시작으로, 듀얼 코어, 쿼드 코어 CPU와 다양한 GPU 아키텍처를 탑재하며 발전해 왔다. 테그라 2는 듀얼 코어 CPU를, 테그라 3는 쿼드 코어 CPU를 최초로 탑재했으며, 테그라 K1은 고성능 GPU를 통해 이전 세대 게임기의 성능을 넘어서는 그래픽 성능을 제공했다. 이후 테그라 X1, X2, 자비에, 오린, 그레이스, 아틀란, 토르에 이르기까지 지속적으로 발전하며, 닌텐도 스위치, 자동차 인포테인먼트 시스템, AI 및 HPC 애플리케이션 등 다양한 분야에 활용되고 있다.

더 읽어볼만한 페이지

ARM 기반 시스템 온 칩 - 삼성 엑시노스
삼성 엑시노스는 삼성전자 시스템LSI 사업부에서 설계 및 생산하는 모바일 AP로, 갤럭시 S에 처음 탑재된 이후 다양한 기기에 사용되었으며, ARM 코어와 자체 개발 코어를 거쳐 AMD와 협력하여 RDNA 아키텍처 기반 GPU를 탑재한 제품을 출시하고 있다.
ARM 기반 시스템 온 칩 - 구글 텐서
구글 텐서는 구글이 자체 개발한 시스템 온 칩(SoC)으로, 픽셀 스마트폰 등 구글 하드웨어 제품에 탑재되어 이미지 처리, AI, 머신 러닝 기능을 강화하며, 여러 세대의 모델이 출시되어 성능과 보안을 향상시키는 데 기여한다.
엔비디아 제품 - 지포스 나우
지포스 나우는 엔비디아에서 제공하는 클라우드 게이밍 서비스로, 엔비디아 그래픽 카드가 탑재된 서버에서 게임을 실행하여 사용자의 장치로 스트리밍하는 방식으로, 사용자는 고사양 PC 없이도 보유한 게임을 즐길 수 있으며, 다양한 요금제와 얼라이언스 파트너를 통해 서비스되고 대한민국에서는 LG유플러스가 제공한다.
엔비디아 제품 - 스케일러블 링크 인터페이스
스케일러블 링크 인터페이스(SLI)는 여러 개의 그래픽 처리 장치(GPU)로 3차원 컴퓨터 그래픽 렌더링 작업을 분담하는 기술이며, 엔비디아가 PCI Express용으로 개량하여 지포스 시리즈에 적용했다.
모바일 컴퓨터 - 모바일 컴퓨팅
모바일 컴퓨팅은 휴대성과 연결성을 특징으로 하는 정보 기술 분야이며, 휴대성, 연결성, 상호 작용, 개별성을 주요 원칙으로 다양한 장치를 포함하고 확장성, 전력 소비, 보안 문제 등의 한계를 가지며 차량 내 컴퓨팅 등 특수한 환경에서도 활용된다.
모바일 컴퓨터 - 전자수첩
전자수첩은 정보를 기록하고 관리하는 휴대용 전자기기로, 1980년대 일본에서 출시되어 주소록, 일정 관리, 메모 기능 등을 제공했으며, 개인용 컴퓨터와 휴대 정보 단말기의 등장으로 시장이 축소되었다.

엔비디아 테그라
기본 정보
NVIDIA Tegra SoC 제품군
제품 유형	시스템 온 칩
브랜드	엔비디아
출시일	2008년 1분기 (Tegra APX 2500)
중단일	2019년 (Tegra TX2)
중앙 처리 장치 (CPU)
명령어 집합	ARM x86 (단종)
그래픽 처리 장치 (GPU)
제조사	엔비디아
특징
특징	전력 관리 HD 비디오 처리 이미지 처리
제품군
제품군	Tegra APX Tegra 2 Tegra 3 Tegra 4 Tegra K1 Tegra X1 Tegra X2 Tegra Xavier Tegra Orin
기타
사용 제품	스마트폰 태블릿 컴퓨터 휴대용 게임기 자동차

2. 역사

엔비디아 테그라는 2008년 2월 APX 2500 모델을 처음 선보였다.^[1] 2008년 6월에는 테그라 6xx 제품군이 공개되었고,^[2] 2009년 2월에는 APX 2600이 발표되었다. APX 칩은 스마트폰, 테그라 600 및 650 칩은 스마트북과 모바일 인터넷 기기(MID)용으로 설계되었다.^[2]

테그라를 탑재한 첫 제품은 2009년 9월 출시된 마이크로소프트의 Zune HD였다.^[3] 이후 삼성전자 M1에도 테그라가 탑재되었다.^[3] 킨은 테그라를 사용한 최초의 휴대폰이었지만,^[4] 앱 스토어가 없어 테그라의 성능을 제대로 활용하지 못했다.

2010년 1월, 엔비디아는 소비자 가전 전시회 2010에서 차세대 테그라인 테그라 250 (테그라 2)를 발표했다.^[7] 2011년 2월 모바일 월드 콩그레스에서는 최초의 쿼드 코어 SoC인 테그라 3 (코드명 Kal-El)을 발표했다.^[9]^[10]

2012년 1월, 아우디는 차량용 인포테인먼트 시스템과 디지털 계기판에 테그라 3 프로세서를 채택한다고 발표했다.^[11] 이 프로세서는 2013년부터 아우디의 모든 차량에 탑재될 예정이며, ISO 26262 인증을 받았다.^[12]

2015년 3월에는 1테라플롭의 그래픽 성능을 가진 테그라 X1이 발표되었다. 2016년 10월, 닌텐도 스위치에 테그라 하드웨어가 탑재될 것이라고 발표되었다.^[14] 2017년 3월, 닌텐도 스위치에는 맞춤형 테그라 X1(모델 T210)이 탑재되었으며 클럭 속도가 낮다는 사실이 밝혀졌다.^[15]

2011년경에 등장한 테그라 2부터 서서히 태블릿 등에 탑재되기 시작했다.^[202] 2017년에 출시된 닌텐도 하이브리드 게임기 닌텐도 스위치에 테그라가 탑재되면서,^[207] 2018년에는 테그라만으로 15.3억달러의 수익을 기록했다 (Switch 관련 9.72억달러, 자동차 관련 5.58억달러).^[208]

3. 특징

엔비디아 테그라(Tegra)는 다음과 같은 특징을 가지고 있다.

저전력으로 높은 그래픽 성능을 제공한다.^[201]
단일 칩에 CPU, GPU, 2D 엔진, HD 동영상 인코더/디코더, 오디오/이미지 처리 등 다양한 기능이 집약되어 칩셋 면적이 작다.^[201]
테그라 2는 세계 최초로 듀얼 코어 ARM Cortex A9 CPU를 탑재했다.
테그라 3는 세계 최초로 쿼드 코어 ARM Cortex A9 CPU를 탑재했다.
테그라 3는 저주파수, 저전력 동작을 위한 컴패니언 CPU 코어를 탑재했다.
테그라 X1은 모바일 프로세서 최초로 1TFLOPS 처리 성능을 달성했다.

테그라는 모바일 SoC(System on a Chip)의 기본 구조를 따르며, ARM 프로세서, GPU, 2D 엔진, HD 동영상 인코더/디코더, 오디오 및 이미지 처리 등 독립된 기능별 프로세서 코어를 하나의 칩에 탑재한다.^[201] 사용하지 않는 기능의 프로세서는 전원을 차단하여 소비 전력을 100~500mW 정도로 낮춘다.^[201]

2011년에 출시된 테그라 2부터 태블릿 등에 탑재되기 시작했으며,^[202] TV에 연결하여 대화면 출력이 가능하고, PS3, Wii, Xbox 등의 게임 컨트롤러를 연결하여 가정용 게임기 수준의 3D 게임을 즐길 수 있다.^[271]

테그라는 스마트폰이나 태블릿 등 모바일 기기용 SoC로서 게임 등에 강한 고성능 처리를 지향했지만, 채용 점유율은 낮았다. 엔비디아는 자체 개발한 태블릿 게임기 엔비디아 실드(nVidia Shield)에 테그라 K1을 탑재하여 점유율 회복을 꾀했다.^[203]

2017년 출시된 닌텐도의 하이브리드 게임기 닌텐도 스위치에 테그라가 탑재되었으며,^[207] 2018년에는 테그라만으로 15억 3000만 달러의 수익을 기록했다(스위치 9억 7200만 달러, 자동차 5억 5800만 달러).^[208]

4. 사양

엔비디아 테그라의 사양은 다음과 같다.


세대		테그라 2	테그라 3	테그라 4	테그라 4i	테그라 K1		테그라 X1	테그라 X1+	테그라 X2	자비에	오린	토르
CPU	명령어 집합	ARMv7-A (32비트)					ARMv8-A (64비트)				ARMv8.2-A (64비트)		ARMv9.2-A (64비트)
	코어	2 A9	4+1 A9	4+1 A15	4+1 A9	4+1 A15	2 덴버	4 A53 (사용 안 함) + 4 A57		2 Denver2 + 4 A57	8 Carmel	12 A78AE	Neoverse V3AE
	L1 캐시 (I/D)	32KB/32KB					128KB/64KB	32KB/32KB + 64KB/32KB		128KB/64KB + 48KB/32KB	128KB/64KB	64KB/64KB
	L2 캐시	1MB		2MB				128KB + 2MB		2MB + 2MB	8MB	3MB	?
	L3 캐시	해당 없음									4MB	6MB	?
GPU	아키텍처	Vec4				Kepler		Maxwell		파스칼	볼타	암페어	블랙웰
	CUDA 코어	4+4^[211]	8+4^[218]	48+24^[230]	48+12^[224]	192		256			512	2048	?
	텐서 코어	해당 없음									64		?
	RT 코어	해당 없음										8	?
RAM	프로토콜	DDR2/LPDDR2	DDR3/LPDDR2	DDR3/LPDDR3				LPDDR3/LPDDR4	LPDDR4/LPDDR4X			LPDDR5	?
	최대 크기	1GB	2GB	4GB		8GB					64GB		128GB
	대역폭	2.7GB/s	6.4GB/s		7.5GB/s	14.88GB/s		25.6GB/s	34.1GB/s	59.7GB/s	136.5GB/s	204.8GB/s	?
공정		40nm		28nm				20nm	16nm		12nm	8nm	4nm

Kepler 이후, 통합 셰이더가 사용됨.

Tegra 650의 그래픽 성능은 "지포스 6" 시리즈 상당으로, 『퀘이크 3 아레나』를 46fps로 실행할 수 있다.^[258]
Tegra 250은 1024x600 해상도를 60fps로 실행할 수 있다.^[259]
Tegra 3은 12코어의 지포스 GPU를 탑재, Tegra 2 대비 약 3배의 그래픽 성능을 가진다.^[260] 1080p, 비디오 재생 및 스테레오스코픽 3D를 지원한다.
Tegra 4는 72코어 GeForce GPU를 탑재, Tegra 3의 약 6배, Tegra 2의 약 20배의 그래픽 성능을 가진다.^[261]
Tegra K1은 192개 CUDA 코어를 탑재, Tegra 4의 3.75배 그래픽 성능을 가지며,^[262] 7세대 가정용 게임기(PS3/Xbox 360) 성능을 넘어섰다.^[263]
Tegra X1은 256개 CUDA 코어를 탑재, Tegra K1의 1.5~2배 그래픽 성능을 가진다. FP16에 대응하며, 최대 1TFLOPS 연산 능력을 가진다.^[264]^[265] HDMI 2.0, HDCP 2.2를 지원하여 60fps 4K 콘텐츠 출력이 가능하며, 내장 하드웨어 비디오 프로세서는 HEVC를 지원, 색 심도는 Deep Color 상당의 10bit까지 지원한다.^[266]
Xavier는 512개 CUDA 코어를 탑재, Volta 아키텍처에 AI 처리를 위한 "텐서 코어"를 탑재하여 Tegra X1 대비 10배 이상 연산 성능을 발휘한다.^[267]^[268] 10W 소비 전력의 NX 시리즈(8GB/16GB)와 40W 소비 전력의 AGX 시리즈(AGX 32GB/64GB, Industrial)가 있다.^[253]
Orin은 Xavier의 6배 처리 성능을 제공한다.^[253] 7W 소비 전력부터 최대 70W 소비 전력의 Nano, NX, AGX 3개 시리즈 9개 모델이 있다.^[269]^[253]

4. 1. 테그라 APX

테그라 APX 시리즈는 엔비디아가 초기 출시한 모바일 프로세서 제품군이다.

Tegra APX^[209]
	아키텍처	CPU		GPU	메모리	비디오 인코딩	화면 해상도
Tegra APX 2500, 2600	ARM11	1코어, 0.6 GHz	NEON 미지원 (Advanced SIMD)	LPDDR-333	720p@30fps	854x480 (LCD) 1280x1024 (CRT) 1280x720 (HDMI)
Tegra 600				LPDDR-333	720p@30fps	1280x1024
Tegra 650				1코어, 0.8 GHz	LPDDR-400	1080p@24fps	1680x1050

'''테그라 600'''은 GPS 및 자동차 분야를 타겟으로 ARM11 700MHz MPCore 프로세서와 저전력 DDR (DDR-333, 166MHz) 메모리를 사용한다. SXGA, HDMI, USB, 스테레오 잭, HD 카메라 720p를 지원한다.
'''테그라 650'''은 휴대용 기기 및 노트북의 GTX를 타겟으로, ARM11 800MHz MPCore 프로세서와 저전력 DDR (DDR-400, 200MHz) 메모리를 사용한다. 1W 미만의 전력을 소비하며, HD 이미지 처리를 지원한다. 1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력을 지원하며, Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치를 직접 지원한다. Windows Mobile 기반 설계를 위한 보드 지원 패키지(BSP)를 제공한다.

4. 1. 1. 테그라 APX 2500

테그라 APX 2500은 ARM11 600 MHz MPCore (원래 지포스 ULV) 프로세서를 기반으로 하며, NOR 또는 NAND 플래시 메모리와 Mobile DDR 메모리를 사용한다. 그래픽은 이미지 프로세서 (FWVGA 854×480 픽셀)를 사용하며, 최대 12 메가픽셀 카메라와 최대 1280×1024 해상도의 LCD 컨트롤러를 지원한다. 저장 장치로는 SSD용 IDE를 지원하며, 비디오 코덱은 최대 720p MPEG-4 AVC/H.264 및 VC-1 디코딩을 지원한다. OpenGL ES 2.0, Direct3D Mobile 및 프로그래밍 가능 셰이더를 지원하는 GeForce ULV를 포함한다. 출력은 HDMI, VGA, composite video, S-Video, 스테레오 잭, USB를 지원하며, USB On-The-Go 기능을 제공한다.^[16]

4. 1. 2. 테그라 APX 2600

wikitext

엔비디아 테그라 APX 2600은 자료가 충분하지 않아, 테그라 250과 함께 요약되어 있다.

Tegra 250^[209]
rowspan="2" \|	제조 공정	아키텍처	CPU			GPU	메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭		코어 수	연산 성능	메모리	비디오 인코딩	화면 해상도	모뎀
Tegra APX 2500, 2600		ARM11	1	0.6 GHz	NEON 미지원 (Advanced SIMD)		LPDDR-333	720p@30fps	854x480 (LCD) 1280x1024 (CRT) 1280x720 (HDMI)	없음
Tegra 600				0.7 GHz			LPDDR-333	720p@30fps	1280x1024
Tegra 650				0.8 GHz			LPDDR-400	1080p@24fps	1680x1050

4. 2. 테그라 6xx

테그라 6xx 시리즈는 테그라 APX 시리즈의 후속 제품군으로, 주로 모바일 기기 및 임베디드 시스템을 대상으로 설계되었다.

모델	프로세서	메모리	특징	주요 용도
테그라 600	ARM11 700MHz MPCore	저전력 DDR (DDR-333, 166MHz)	SXGA, HDMI, USB, 스테레오 잭, HD 카메라 720p 지원	GPS 및 자동차 분야
테그라 650	ARM11 800MHz MPCore	저전력 DDR (DDR-400, 200MHz)	1W 미만 소비 전력, HD 이미지 처리, 1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력, Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치 직접 지원, Windows Mobile 기반 설계를 위한 보드 지원 패키지(BSP) 제공	휴대용 기기 및 노트북

하위 섹션에서 이미 상세히 다루고 있으므로, 테그라 600과 테그라 650에 대한 간략한 정보만 표 형태로 제공하여 중복을 최소화하였다.

4. 2. 1. 테그라 600

GPS 및 자동차 분야를 타겟으로 한다.
프로세서: ARM11 700MHz MPCore
메모리: 저전력 DDR (DDR-333, 166MHz)
SXGA, HDMI, USB, 스테레오 잭을 지원한다.
HD 카메라 720p를 지원한다.

4. 2. 2. 테그라 650

테그라 650은 휴대용 기기 및 노트북을 겨냥한 GTX 제품군이다. ARM11 800MHz MPCore 프로세서를 탑재했으며, 저전력 DDR (DDR-400, 200MHz) 메모리를 사용한다. 1W 미만의 낮은 소비 전력을 특징으로 하며, 고급 디지털 카메라 및 HD 캠코더 기능을 위한 HD 이미지 처리를 지원한다.^[209]

1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력을 지원한다. Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치를 직접 지원하며, Windows Mobile 기반 설계를 빠르게 출시할 수 있도록 완벽한 보드 지원 패키지(BSP)를 제공한다.^[209]

4. 3. 테그라 2

테그라 2는 2세대 테그라로, 1GHz Cortex A9 듀얼 코어 CPU와 ULP(Ultra Low Power) GeForce GPU, 싱글 채널 DDR2 메모리 컨트롤러를 탑재했다. 코어당 32KB/32KB L1 캐시와 1MB 공유 L2 캐시를 가지고 있다.^[281]^[282]

테그라 2는 SoC 하드웨어 코덱이 지원하는 포맷이 제한적이다. 소프트웨어 가속을 하더라도 ARM NEON 명령어를 지원하지 않아 동영상 디코딩 성능이 떨어진다. ARM NEON을 지원하는 이전 세대 싱글 코어 AP보다 성능이 낮으며, 퀄컴의 스냅드래곤 S3 프로세서와 비교해도 성능 차이가 크지 않은 듀얼 코어 프로세서이다.

4. 3. 1. 모델

엔비디아 테그라 250 AP20H (Ventana)는 40nm 공정으로 제조되었으며, ARMv7 아키텍처를 기반으로 한다. 1 GHz ARM Cortex-A9 듀얼 코어 CPU와 ULP GeForce 300 MHz GPU를 탑재하고 있다. 32비트 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR2 메모리를 지원하며, 2010년 1분기에 출시되었다. LG 옵티머스 2X, 모토로라 아트릭스 등의 기기에 사용되었다.^[281]^[282]

테그라 250 T20 (Harmony)는 AP20H와 동일한 CPU를 사용하지만, GPU 클럭이 333 MHz로 약간 더 높다. 모토로라 줌, 삼성 갤럭시 탭 10.1 등에 사용되었다.^[281]^[282]

테그라 250 3D AP25와 T25는 1.2 GHz CPU와 400 MHz GPU를 탑재하여 성능이 향상되었다. AP25는 LG 옵티머스 Q2, LG 옵티머스 EX에 사용되었다.

테그라 600 시리즈는 GPS 및 자동차 분야를 타겟으로 하며, 테그라 600은 ARM11 700MHz MPCore CPU와 저전력 DDR (DDR-333, 166MHz) 메모리를 탑재했다. 테그라 650은 ARM11 800MHz MPCore CPU와 저전력 DDR (DDR-400, 200MHz) 메모리를 탑재했으며, 1W 미만의 소비 전력을 가진다.

테그라 4i(코드명 "그레이")는 2013년 2월 19일에 발표되었으며, Cortex-A9 코어를 사용하여 테그라 4의 저전력 변종으로 설계되었다. Icera i500 LTE/HSPA+ 베이스밴드 프로세서를 통합한다.^[48]

테그라 K1(코드명 "로건")은 ARM Cortex-A15 코어 또는 엔비디아의 64비트 프로젝트 덴버 듀얼 코어 프로세서와 케플러 GPU를 특징으로 한다.^[73]^[74]

테그라 K1은 32비트 버전과 64비트 버전으로 나뉜다. 32비트 버전은 Cortex-A15 R3 4+1 코어, 64비트 버전은 Denver 듀얼 코어를 사용한다. 두 버전 모두 GK20A (케플러) GPU를 탑재했다.^[80]^[81]^[82]^[83]

다음은 모델별 상세 사양을 표로 정리한 것이다.

모델명	반도체 공정	CPU 아키텍처	CPU	GPU	지원 메모리	출시일
테그라 250 AP20H (Ventana)	40nm	ARMv7	1 GHz ARM Cortex-A9 듀얼 코어	ULP GeForce 300 MHz	32-bit 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR2	2010년 1분기
테그라 250 T20 (Harmony)	40nm	ARMv7	1 GHz ARM Cortex-A9 듀얼코어	ULP GeForce 333 MHz	32비트 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR2	2010년 1분기
테그라 250 3D AP25	40nm	ARMv7	1.2 GHz ARM Cortex-A9 듀얼 코어	ULP GeForce 400 MHz	32비트 싱글채널 600 MHz LPDDR2 또는 667 MHz DDR2	2011년 1분기
테그라 250 3D T25	40nm	ARMv7	1.2 GHz dual-core ARM Cortex-A9	ULP GeForce 400 MHz	32-bit Single-channel 600 MHz LPDDR2 또는 667 MHz DDR2	2011년 1분기

모델 번호	CPU			GPU			메모리				채택
모델 번호	프로세서	코어	주파수	마이크로아키텍처	코어 구성¹	주파수	유형	용량	버스 폭	대역 폭	출시
T148?^[66]	Cortex-A9 "R4"	4+1	최대 2.0 GHz	VLIW 기반 VEC4 유닛^[67]	60 (48:12:2)^[67]	660 MHz^[50]	LPDDR3		32비트 단일 채널	6.4–7.5 GB/s (800–933 MHz)^[52]	2014년 1분기

모델 번호	CPU			GPU				메모리				채택
모델 번호	프로세서	코어	주파수	마이크로- 아키텍처	코어 구성¹	주파수	GFLOPS (FP32)	유형	용량	버스 폭	대역- 폭	사용 가능 여부
T124^[80]	Cortex-A15 R3 (32비트)	4+1	최대 2.3 GHz^[81]	GK20A (케플러)	192:8:4^[82]	756–951 MHz	290–365^[83]	DDR3L LPDDR3^[82]	최대 8 GB 40비트 주소 확장² 사용	64 비트	17 GB/s^[82]	2014년 2분기
T132	Denver (64비트)	2^[82]	최대 2.5 GHz^[81]	GK20A (케플러)	192:8:4^[82]	756–951 MHz	290–365^[83]	DDR3L LPDDR3^[82]	최대 8 GB	?	?	2014년 3분기

¹ 통합 셰이더: 텍스처 매핑 유닛 : 렌더 출력 유닛² ARM LPAE(Large Physical Page Extension)는 1 TiB (2⁴⁰ 바이트)를 지원한다. 8 GiB 제한은 부품별로 다르다.

Tegra 250^[209]
rowspan="2" \|	제조 공정	아키텍처	CPU			GPU		메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭		코어 수	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra APX 2500, 2600		ARM11	1	0.6 GHz	NEON 미지원 (Advanced SIMD)			LPDDR-333	720p@30fps	854x480 (LCD) 1280x1024 (CRT) 1280x720 (HDMI)	없음
Tegra 600				0.7 GHz				LPDDR-333	720p@30fps	1280x1024
Tegra 650				0.8 GHz				LPDDR-400	1080p@24fps	1680x1050
Tegra 230	40 nm^[210]	Cortex-A9	2	1.0 GHz	VFPv3-D16 (VFPv3 대비 레지스터 수 절반) NEON 미지원 (Advanced SIMD)	8 (4:4)^[211]	단정밀도 5.6 GFLOPS (333 MHz)^[212]	싱글 채널 LPDDR2-600	1080p	1024x600 (LCD) 1280x1024 (CRT) 1920x1080 (HDMI)
Tegra 250	40 nm^[210]	Cortex-A9	2	1.0 GHz	VFPv3-D16 (VFPv3 대비 레지스터 수 절반) NEON 미지원 (Advanced SIMD)	8 (4:4)^[211]	단정밀도 5.6 GFLOPS (333 MHz)^[212]	싱글 채널 LPDDR2-600, 667	1080p	1680x1050 (LCD) 1600x1200 (CRT)1920x1080 (HDMI)

Tegra 3 / Tegra 4
rowspan="2" \|	제조 공정	아키텍처	CPU					GPU		메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭		연산 성능	L2 캐시	코어 수	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra 3	40 nm^[213]	Cortex-A9	4 + 1^[214]	1.3 - 1.7 GHz	VFPv3 NEON 지원 (Advanced SIMD)	단정밀도 27.2 GFLOPS^[215] 배정밀도 10.2 GFLOPS^[216]	1 MB^[217]	12 (4:8)^[218]	단정밀도 12.4 GFLOPS（520 MHz^[219]^[220]）	32bit 싱글 채널 LPDDR3-L 1600, LPDDR2-1066	1440p	2048x1536(LCD) 1920x1200(CRT) 1920x1080(HDMI)	없음
Tegra 4i	28 nm^[221]	Cortex-A9 R4		? - 2.3 GHz	VFPv4 NEON 지원 (Advanced SIMD)	단정밀도 36.8 GFLOPS^[222] 배정밀도 13.8 GFLOPS^[223]	1 MB^[217]	60 (20:40)^[224]	단정밀도 79.2 GFLOPS (660 MHz^[225])	32bit 싱글 채널 LPDDR3-2133		1920x1200(LCD) 1920x1080(HDMI)	LTE Cat4 HSPA+ TD-HSPA GSM / GPRS / EDGE
Tegra 4	28 nm^[221]	Cortex-A15 r2		1.2 - 1.9 GHz	VFPv4 NEON 지원 (Advanced SIMD)	단정밀도 60.8 GFLOPS^[226] 배정밀도 15.2 GFLOPS^[227]	2 MB + 0.5 MB^[228]	72^[229] (24:48)^[230]	단정밀도 96.76 GFLOPS (672 MHz^[231])	32bit 듀얼 채널 LPDDR3-L, LPDDR3-1866		3200x2000(LCD) 3840x2160(HDMI)	없음

Tegra K1 / Tegra X1 / Tegra X2
rowspan="2" \|	제조 공정	아키텍처	CPU				GPU			메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭	연산 성능	L2 캐시	코어 수	클럭	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra K1	28 nm^[232] (TSMC HPM)	Cortex-A15 r3	4 + 1	? - 2.3 GHz	단정밀도 73.6 GFLOPS^[233] 배정밀도 18.4 GFLOPS^[234]	2 MB + 0.5 MB^[235]	CUDA Kepler Unified Shader 192 코어	950 MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)	없음
Tegra K1	28 nm^[232] (TSMC HPM)	Denver	2	? - 2.5 GHz^[237]	단정밀도 40 GFLOPS^[238] 배정밀도 20 GFLOPS^[239]	2 MB^[240]	CUDA Kepler Unified Shader 192 코어	950 MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)
Tegra X1^[241]	20 nm (TSMC 20 SoC)	Cortex-A57 + Cortex-A53^[242]	4 + 4^[243]	Cortex-A57 1.9 GHz^[244]	rowspan="2" \|	2 MB + 0.5 MB^[245]	CUDA Maxwell 256 코어^[246]	1024 MHz	단정밀도 512 GFLOPS^[247]	64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s^[248]	H.265, VP9 등 2160p 30fps	4096x2160 60fps
Tegra X1+^[249]^[250]	16 nm	Cortex-A57 + Cortex-A53^[242]	4 + 4^[243]	Cortex-A57 1.9 GHz^[244]	1267 MHz^[251]	2 MB + 0.5 MB^[245]	CUDA Maxwell 256 코어^[246]	단정밀도 649 GFLOPS	64bit LPDDR4X		H.265, VP9 등 2160p 30fps
Tegra X2 (Parker)^[252]	16 nm	Denver 2 + Cortex-A57	2 + 4	2.0 GHz + 2.0 GHz		2 MB + 2 MB	CUDA Pascal 256 코어	1465 MHz	단정밀도 750 GFLOPS	128bit LPDDR4 58.4 GB/s	H.265, VP9 등 2160p 60fps

Xavier / Orin
rowspan="2" \|	제조 공정	아키텍처	CPU					GPU			메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭	연산 성능	L2 캐시	L3 캐시	코어 수	클럭	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Xavier^[253]	12 nm	NVIDIA Carmel Arm®v8.2	8	1.9GHz（Nano） 2.2 GHz（AGX）		6MBr^[253]	4MB^[253]	CUDA Volta 384코어 Tensor 48코어（Nano）	1.1 GHz（Nano）	단정밀도 1410 GFLOPS	128bit LPDDR4X 59.7 GB/s	H.265,VP9 등 4K 60fps	3840x2160 60fps
Orin^[255]	8 nm	Cortex®-A78AE v8.2	12	1.5GHz（Nano） 2.2 GHz（AGX)		1.5MB（Nano） 3MB（AGX)	4MB（Nano） 6MB（AGX)	CUDA Ampere 512코어 Tensor 16코어（Nano）	625 MHz（Nano）	단정밀도 0.64 – 5.32 TFLOPS	128bit LPDDR5 102.4 GB/s	H.265,VP9,AV1 등 4K 60fps	3840x2160 60fps

4. 4. 테그라 3 (칼엘)

테그라 3(코드명 "칼엘")은 쿼드 코어 ARM Cortex-A9 CPU와 저전력 상황에서 작동하는 컴패니언 코어를 결합한 "4-PLUS-1" 아키텍처를 사용한다. 이 기술은 상황에 따라 4개의 주 코어 또는 저전력 컴패니언 코어를 활용하여 전체 소비 전력을 줄이는 방식이다.^[283]

엔비디아 ULP GeForce GPU는 테그라 2 GPU에서 발전된 형태로, 4개의 픽셀 셰이더 유닛이 추가되었고 더 높은 클럭으로 작동한다. 최대 2560x1600 해상도의 비디오 출력을 지원하며, 1080p H.264 High-Profile @ 40 Mbps의 하드웨어 비디오 가속을 지원한다. 이전 세대와 달리 NEON SIMD 확장 기능을 지원한다.

4. 4. 1. 모델

3세대 테그라는 네 개의 1.3Ghz Cortex A9 코어와 "컴패니언" 코어로 불리는 저전력 저클럭의 서브코어로 구성되어 있다. 엔비디아는 로드가 낮을 때 다른 코어는 모두 오프라인 상태로 만들고 컴패니언 코어만 사용해 연산을 하여 전력소모를 최대 61%까지 줄였다고 주장한다.^[283] 이 새로운 방식의 코어로 인해 테그라 3는 종종 4+1 코어로 불린다.

이전 세대의 테그라와는 달리 NEON SIMD 명령어를 탑재하였으며 2560x1600 해상도의 화면 출력과 1080p H264 High-Profile @ 40 Mbps의 하드웨어 동영상 가속을 지원한다.

모델명	반도체 공정	CPU 아키텍처	CPU	CPU 캐시	GPU	메모리 지원	출시시기	탑재 기기
테그라 3 T30L	40 nm LPG by TSMC	ARMv7	1.2 GHz 쿼드코어 ARM Cortex-A9 (싱글 코어 모드에서 최대 1.3 GHz)	L1: 32 KB instruction + 32 KB data, L2: 1 MB	416 MHz ULP GeForce	32-비트 싱글채널 667 MHz DDR3^[284]	2012년 1분기	ASUS Transformer Pad 300, 에이수스 :en:Nexus 7^[285]
테그라 3 T30	40 nm LPG by TSMC	ARMv7	1.4 GHz 쿼드코어 ARM Cortex-A9 (싱글코어 가동시 1.5 GHz)	L1: 32 KB instruction + 32 KB data, L2: 1 MB	520 MHz ULP GeForce	32비트 싱글채널 1066 MHz LPDDR2 또는 1500 MHz DDR3-L^[286]	2011년 4분기	:en:Asus Eee Pad Transformer Prime,^[287] IdeaTab K2 / LePad K2,^[288] :en:Acer Iconia Tab A510, :en:Acer Iconia Tab A700, :en:LG Optimus 4X HD, :en:HTC One X, ZTE Era, ZTE PF 100, ZTE T98, Toshiba AT270, Toshiba AT300 (Excite 10), Asus Tablet 610, Fuhu Inc. nabi 2 Tablet^[289], :en:Tesla Model S
테그라 3 T33	40 nm LPG by TSMC	ARMv7	1.6 GHz 쿼드코어 ARM Cortex-A9 (싱글코어 가동시 1.7 GHz)^[290]	L1: 32 KB instruction + 32 KB data, L2: 1 MB	520 MHz ULP GeForce	32비트 싱글채널 1600 MHz DDR3^[291]	2012년 2분기	ASUS Transformer Pad Infinity 700 (TF700T), :en:Ouya

; 테그라 600

GPS 및 자동차 분야 타겟
프로세서: ARM11 700MHz MPCore
메모리: 저전력 DDR (DDR-333, 166MHz)
SXGA, HDMI, USB, 스테레오 잭
HD 카메라 720p

; 테그라 650

휴대용 기기 및 노트북의 GTX 타겟
프로세서: ARM11 800MHz MPCore
저전력 DDR (DDR-400, 200MHz)
1W 미만 소비 전력
고급 디지털 카메라 및 HD 캠코더 기능을 위한 HD 이미지 처리
디스플레이는 1080p 24프레임/초, HDMI v1.3, WSXGA+ LCD 및 CRT, NTSC/PAL TV 출력을 지원
Wi-Fi, 디스크 드라이브, 키보드, 마우스 및 기타 주변 장치 직접 지원
Windows Mobile 기반 설계를 위한 빠른 출시를 가능하게 하는 완벽한 보드 지원 패키지(BSP)

모델	장치
T124	Jetson TK1 개발 보드,^[84] 엔비디아 쉴드 태블릿(Shield Tablet),^[85] 에이서 크롬북 13,^[86] HP 크롬북 14 G3,^[87] 샤오미 미패드,^[88] 스네일 게임즈(Snail Games) OBox, UTStarcom MC8718, 구글 프로젝트 탱고 태블릿,^[89] 아팔리스 TK1 시스템 온 모듈,^[90] 퓨즈 토마호크 F1,^[91] JXD 싱귤래리티 S192^[92]
T132	HTC 넥서스 9(Nexus 9)^[93]^[94]

2015년에 출시된 엔비디아의 Tegra X1(코드명 "Erista")은 두 개의 CPU 클러스터를 특징으로 하며, 하나는 4개의 ARM Cortex-A57 코어를, 다른 하나는 4개의 ARM Cortex-A53 코어를, 그리고 Maxwell 기반의 그래픽 처리 장치를 가지고 있다.^[96]^[97]

Adaptive Scalable Texture Compression을 지원한다.^[76]

공식적으로 '''Tegra X1+'''로 알려진, 전력 효율성이 향상된 개정판(코드명 "Mariko")은 2019년에 출시되었다.^[102] 또한 T214 및 T210B01로 알려져 있다.

CPU: ARMv8 ARM Cortex-A57 쿼드 코어(64비트) + (미사용?) ARM Cortex-A53 쿼드 코어(64비트)
GPU: Maxwell 기반 256 코어 GPU (Jetson Nano: 128코어만)
MPEG-4 HEVC VP8 인코딩/디코딩 및 VP9 디코딩 지원^[103] (Jetson Nano: 인코더는 H.265, H.264/스테레오, VP8, JPEG; 디코더는 H.265, H.264/스테레오, VP8, VP9, VC-1, MPEG-2, JPEG)
TSMC 20 nm 공정 (Tegra X1)
TSMC 16 nm 공정 (Tegra X1+)
TDP:
* T210: 15 W,^[104] 평균 전력 소비는 10 W 미만^[103]
* Jetson Nano: 10 W(모드 0);^[105] 모드 1: 5W(2개의 CPU 코어만 @ 918 MHz, GPU @ 640 MHz)

모델 번호	SOC 변형	공정	CPU			GPU					메모리				채택
모델 번호	SOC 변형	공정	프로세서	코어	주파수¹	마이크로- 아키텍처	코어 구성²	주파수	GFLOPS (FP32)	GFLOPS (FP16)	유형	용량³	버스 너비	대역- 폭⁴	사용 가능 여부
T210	ODNX02-A2	TSMC 20 nm	Cortex-A57 + Cortex-A53^[106]	A57: 4 A53: 4^[106]	A57: 2.2 GHz^[107] A53: 1.3 GHz	GM20B (Maxwell)^[106]	256:^[106] 16:16	1000 MHz	512	1024	LPDDR3 / LPDDR4	8 GB^[106]	64 비트^[106]	25.6 GB/s	2015년 2분기
T210	TM660M-A2	TSMC 20 nm	Cortex-A57 + Cortex-A53^[106]	A57: 4 A53: 4^[106]	A57: 1.428 GHz A53: ? GHz	GM20B (Maxwell)^[106]	128:16:16	921 MHz	236	472	LPDDR3? / LPDDR4	4 GB		25.6 GB/s	2019년 3월
T214 / T210b01	ODNX10-A1	TSMC 16 nm	Cortex-A57	A57: 4	A57: 2.1 GHz^[108]	GM21B (Maxwell)^[109]	256:16:16	1267 MHz^[110]	649	1298	LPDDR4 /LPDDR4X	8 GB		34.1 GB/s	2019년 2분기

Tegra 250^[209]
rowspan="2" \|	제조 공정	아키텍처	CPU			GPU		메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭		코어 수	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra APX 2500, 2600		ARM11	1	0.6 GHz	NEON 미지원 (Advanced SIMD)			LPDDR-333	720p@30fps	854x480 (LCD) 1280x1024 (CRT) 1280x720 (HDMI)	없음
Tegra 600				0.7 GHz				LPDDR-333	720p@30fps	1280x1024
Tegra 650				0.8 GHz				LPDDR-400	1080p@24fps	1680x1050
Tegra 230	40 nm^[210]	Cortex-A9	2	1.0 GHz	VFPv3-D16 (VFPv3 대비 레지스터 수 절반) NEON 미지원 (Advanced SIMD)	8 (4VS : 4PS)^[211]	단정밀도 5.6 GFLOPS (333 MHz)^[212]	싱글 채널 LPDDR2-600	1080p	1024x600 (LCD) 1280x1024 (CRT) 1920x1080 (HDMI)
Tegra 250	40 nm^[210]	Cortex-A9	2	1.0 GHz	VFPv3-D16 (VFPv3 대비 레지스터 수 절반) NEON 미지원 (Advanced SIMD)	8 (4VS : 4PS)^[211]	단정밀도 5.6 GFLOPS (333 MHz)^[212]	싱글 채널 LPDDR2-600, 667	1080p	1680x1050 (LCD) 1600x1200 (CRT)1920x1080 (HDMI)

Tegra 3 / Tegra 4
rowspan="2" \|	제조 공정	아키텍처	CPU					GPU		메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭		연산 성능	L2 캐시	코어 수	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra 3	40 nm^[213]	Cortex-A9	4 + 1^[214]	1.3 - 1.7 GHz	VFPv3 NEON 지원 (Advanced SIMD)	단정밀도 27.2 GFLOPS^[215] 배정밀도 10.2 GFLOPS^[216]	1 MB^[217]	12 (4VS : 8PS^[218]	단정밀도 12.4 GFLOPS (520 MHz^[219]^[220])	32bit 싱글 채널 LPDDR3-L 1600, LPDDR2-1066	1440p	2048x1536(LCD) 1920x1200(CRT) 1920x1080(HDMI)	없음
Tegra 4i	28 nm^[221]	Cortex-A9 R4		? - 2.3 GHz	VFPv4 NEON 지원 (Advanced SIMD)	단정밀도 36.8 GFLOPS^[222] 배정밀도 13.8 GFLOPS^[223]	1 MB^[217]	60 (20VS : 40PS^[224])	단정밀도 79.2 GFLOPS (660 MHz^[225])	32bit 싱글 채널 LPDDR3-2133		1920x1200(LCD) 1920x1080(HDMI)	LTE Cat4 HSPA+ TD-HSPA GSM / GPRS / EDGE
Tegra 4	28 nm^[221]	Cortex-A15 r2		1.2 - 1.9 GHz	VFPv4 NEON 지원 (Advanced SIMD)	단정밀도 60.8 GFLOPS^[226] 배정밀도 15.2 GFLOPS^[227]	2 MB + 0.5 MB^[228]	72^[229] (24VS : 48PS^[230])	단정밀도 96.76 GFLOPS (672 MHz^[231])	32bit 듀얼 채널 LPDDR3-L, LPDDR3-1866		3200x2000(LCD) 3840x2160(HDMI)	없음

Tegra K1 / Tegra X1 / Tegra X2
rowspan="2" \|	제조 공정	아키텍처	CPU				GPU			메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭	연산 성능	L2 캐시	코어 수	클럭	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra K1	28 nm^[232] (TSMC HPM)	Cortex-A15 r3	4 + 1	? - 2.3 GHz	단정밀도 73.6 GFLOPS^[233] 배정밀도 18.4 GFLOPS^[234]	2 MB + 0.5 MB^[235]	CUDA Kepler Unified Shader 192 코어	950 MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)	없음
Tegra K1	28 nm^[232] (TSMC HPM)	Denver	2	? - 2.5 GHz^[237]	단정밀도 40 GFLOPS^[238] 배정밀도 20 GFLOPS^[239]	2 MB^[240]	CUDA Kepler Unified Shader 192 코어	950 MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)
Tegra X1^[241]	20 nm (TSMC 20 SoC)	Cortex-A57 + Cortex-A53^[242]	4 + 4^[243]	Cortex-A57 1.9 GHz^[244]	rowspan="2" \|	2 MB + 0.5 MB^[245]	CUDA Maxwell 256 코어^[246]	1024 MHz	단정밀도 512 GFLOPS^[247]	64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s^[248]	H.265, VP9 등 2160p 30fps	4096x2160 60fps
Tegra X1+^[249]^[250]	16 nm	Cortex-A57 + Cortex-A53^[242]	4 + 4^[243]	Cortex-A57 1.9 GHz^[244]	1267 MHz^[251]	2 MB + 0.5 MB^[245]	CUDA Maxwell 256 코어^[246]	단정밀도 649 GFLOPS	64bit LPDDR4X		H.265, VP9 등 2160p 30fps
Tegra X2 (Parker)^[252]	16 nm	Denver 2 + Cortex-A57	2 + 4	2.0 GHz + 2.0 GHz		2 MB + 2 MB	CUDA Pascal 256 코어	1465 MHz	단정밀도 750 GFLOPS	128bit LPDDR4 58.4 GB/s	H.265, VP9 등 2160p 60fps

Xavier / Orin
rowspan="2" \|	제조 공정	아키텍처	CPU					GPU			메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭	연산 성능	L2 캐시	L3 캐시	코어 수	클럭	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Xavier^[253]	12 nm	NVIDIA Carmel Arm®v8.2	8	1.9GHz (Nano) 2.2 GHz (AGX)		6MB^[253]	4MB^[253]	CUDA Volta 384코어 Tensor 48코어 (Nano)	1.1 GHz (Nano)	단정밀도 1410 GFLOPS	128bit LPDDR4X 59.7 GB/s	H.265,VP9 등 4K 60fps	3840x2160 60fps
Orin^[255]	8 nm	Cortex®-A78AE v8.2	12	1.5GHz (Nano) 2.2 GHz (AGX)		1.5MB (Nano) 3MB (AGX)	4MB (Nano) 6MB (AGX)	CUDA Ampere 512코어 Tensor 16코어 (Nano)	625 MHz (Nano)	단정밀도 0.64 – 5.32 TFLOPS	128bit LPDDR5 102.4 GB/s	H.265,VP9,AV1 등 4K 60fps	3840x2160 60fps

4. 5. 테그라 4 (웨인)

테그라 4(코드명 "웨인")는 2013년 초에 출시된 시스템 온 칩(SoC)이다.^[261]

테그라 4는 ARM Cortex-A15 CPU와 저전력 Cortex-A15 컴패니언 코어를 탑재한 쿼드 코어 프로세서로, 테그라 3와 유사한 가변 SMP 아키텍처(4+1 코어)를 사용하며 1.9GHz로 작동한다. 72코어 ULP 지포스 GPU를 탑재하여 이전 제품보다 향상된 기능과 효율성을 제공한다.^[261]

최대 1080p 60Mbit/s @ 60fps의 WebM 비디오 하드웨어 디코딩 및 인코딩을 지원하며, Icera 인수 후 개발된 소프트웨어 정의 라디오 i500을 통해 카테고리 3(100Mbit/s) LTE를 지원하고, 추후 카테고리 4(150Mbit/s) 업데이트가 예정되어 있다.

4. 5. 1. 모델

모델명	반도체 공정	CPU 아키텍처	CPU	GPU	지원 메모리	출시일	통신칩
테그라 4 T40	28 nm	ARMv7	1.8 GHz ARM Cortex-A15 쿼드 코어	ULP GeForce 672 MHz	32-bit 듀얼채널 ?? MHz LPDDR3& ?? MHz DDR3L	2013 Q1
테그라 4 T43	28 nm	ARMv7	2.0 GHz ARM Cortex-A15 쿼드 코어	ULP GeForce 672 MHz	32비트 듀얼채널 ?? MHz LPDDR3& ?? MHz DDR3L	2013 Q3
테그라 4 AP40	28 nm	ARMv7	?? GHz ARM Cortex-A15 쿼드 코어	ULP GeForce 672 MHz	32비트 듀얼채널 ?? MHz LPDDR3& ?? MHz DDR3L	2013 Q3
테그라 4i SP3X	28 nm	ARMv7	2.3 GHz ARM Cortex-A9 쿼드 코어	ULP GeForce 400 MHz	32-bit 듀얼채널 ?? MHz LPDDR3	2013 Q3	i500 LTE 베이스밴드, TD-SCDMA/WCDMA/FDD-LTE/TD-LTE

Tegra 250^[209]
rowspan="2" \|	제조 공정	아키텍처	CPU			GPU		메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭		코어 수	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra APX 2500, 2600		ARM11	1	0.6 GHz	NEON 미지원 (Advanced SIMD)			LPDDR-333	720p@30fps	854x480 (LCD) 1280x1024 (CRT) 1280x720 (HDMI)	없음
Tegra 600				0.7 GHz				LPDDR-333	720p@30fps	1280x1024
Tegra 650				0.8 GHz				LPDDR-400	1080p@24fps	1680x1050
Tegra 230	40 nm^[210]	Cortex-A9	2	1.0 GHz	VFPv3-D16 (VFPv3 대비 레지스터 수 절반) NEON 미지원 (Advanced SIMD)	8 (4 셰이더 프로세서 : 4 픽셀 셰이더)^[211]	단정밀도 5.6 GFLOPS (333 MHz)^[212]	싱글 채널 LPDDR2-600	1080p	1024x600 (LCD) 1280x1024 (CRT) 1920x1080 (HDMI)
Tegra 250	40 nm^[210]	Cortex-A9	2	1.0 GHz	VFPv3-D16 (VFPv3 대비 레지스터 수 절반) NEON 미지원 (Advanced SIMD)	8 (4 셰이더 프로세서 : 4 픽셀 셰이더)^[211]	단정밀도 5.6 GFLOPS (333 MHz)^[212]	싱글 채널 LPDDR2-600, 667	1080p	1680x1050 (LCD) 1600x1200 (CRT)1920x1080 (HDMI)

Tegra 3 / Tegra 4
rowspan="2" \|	제조 공정	아키텍처	CPU					GPU		메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭		연산 성능	L2 캐시	코어 수	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra 3	40 nm^[213]	Cortex-A9	4 + 1^[214]	1.3 - 1.7 GHz	VFPv3 NEON 지원 (Advanced SIMD)	단정밀도 27.2 GFLOPS^[215] 배정밀도 10.2 GFLOPS^[216]	1 MB^[217]	12 (4 셰이더 프로세서 : 8 픽셀 셰이더)^[218]	단정밀도 12.4 GFLOPS (520 MHz^[219]^[220])	32bit 싱글 채널 LPDDR3-L 1600, LPDDR2-1066	1440p	2048x1536(LCD) 1920x1200(CRT) 1920x1080(HDMI)	없음
Tegra 4i	28 nm^[221]	Cortex-A9 R4		? - 2.3 GHz	VFPv4 NEON 지원 (Advanced SIMD)	단정밀도 36.8 GFLOPS^[222] 배정밀도 13.8 GFLOPS^[223]	1 MB^[217]	60 (20 셰이더 프로세서 : 40 픽셀 셰이더)^[224]	단정밀도 79.2 GFLOPS (660 MHz^[225])	32bit 싱글 채널 LPDDR3-2133		1920x1200(LCD) 1920x1080(HDMI)	LTE Cat4 HSPA+ TD-HSPA GSM / GPRS / EDGE
Tegra 4	28 nm^[221]	Cortex-A15 r2		1.2 - 1.9 GHz	VFPv4 NEON 지원 (Advanced SIMD)	단정밀도 60.8 GFLOPS^[226] 배정밀도 15.2 GFLOPS^[227]	2 MB + 0.5 MB^[228]	72^[229] (24 셰이더 프로세서 : 48 픽셀 셰이더)^[230]	단정밀도 96.76 GFLOPS (672 MHz^[231])	32bit 듀얼 채널 LPDDR3-L, LPDDR3-1866		3200x2000(LCD) 3840x2160(HDMI)	없음

Tegra K1 / Tegra X1 / Tegra X2
rowspan="2" \|	제조 공정	아키텍처	CPU				GPU			메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭	연산 성능	L2 캐시	코어 수	클럭	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra K1	28 nm^[232] (TSMC HPM)	Cortex-A15 r3	4 + 1	? - 2.3 GHz	단정밀도 73.6 GFLOPS^[233] 배정밀도 18.4 GFLOPS^[234]	2 MB + 0.5 MB^[235]	CUDA Kepler Unified Shader 192 코어	950 MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)	없음
Tegra K1	28 nm^[232] (TSMC HPM)	Denver	2	? - 2.5 GHz^[237]	단정밀도 40 GFLOPS^[238] 배정밀도 20 GFLOPS^[239]	2 MB^[240]	CUDA Kepler Unified Shader 192 코어	950 MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)
Tegra X1^[241]	20 nm (TSMC 20 SoC)	Cortex-A57 + Cortex-A53^[242]	4 + 4^[243]	Cortex-A57 1.9 GHz^[244]	rowspan="2" \|	2 MB + 0.5 MB^[245]	CUDA Maxwell 256 코어^[246]	1024 MHz	단정밀도 512 GFLOPS^[247]	64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s^[248]	H.265, VP9 등 2160p 30fps	4096x2160 60fps
Tegra X1+^[249]^[250]	16 nm	Cortex-A57 + Cortex-A53^[242]	4 + 4^[243]	Cortex-A57 1.9 GHz^[244]	1267 MHz^[251]	2 MB + 0.5 MB^[245]	CUDA Maxwell 256 코어^[246]	단정밀도 649 GFLOPS	64bit LPDDR4X		H.265, VP9 등 2160p 30fps
Tegra X2 (Parker)^[252]	16 nm	Denver 2 + Cortex-A57	2 + 4	2.0 GHz + 2.0 GHz		2 MB + 2 MB	CUDA Pascal 256 코어	1465 MHz	단정밀도 750 GFLOPS	128bit LPDDR4 58.4 GB/s	H.265, VP9 등 2160p 60fps

Xavier / Orin
rowspan="2" \|	제조 공정	아키텍처	CPU					GPU			메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭	연산 성능	L2 캐시	L3 캐시	코어 수	클럭	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Xavier^[253]	12 nm	NVIDIA Carmel Armv8.2	8	1.9GHz (Nano) 2.2 GHz (AGX)		6MB^[253]	4MB^[253]	CUDA Volta 384코어 Tensor 48코어 (Nano)	1.1 GHz (Nano)	단정밀도 1410 GFLOPS	128bit LPDDR4X 59.7 GB/s	H.265, VP9 등 4K 60fps	3840x2160 60fps
Orin^[255]	8 nm	Cortex-A78AE v8.2	12	1.5GHz (Nano) 2.2 GHz (AGX)		1.5MB (Nano) 3MB (AGX)	4MB (Nano) 6MB (AGX)	CUDA Ampere 512코어 Tensor 16코어 (Nano)	625 MHz (Nano)	단정밀도 0.64 – 5.32 TFLOPS	128bit LPDDR5 102.4 GB/s	H.265, VP9, AV1 등 4K 60fps	3840x2160 60fps

모델 번호	CPU			GPU					메모리				채택
모델 번호	프로세서	코어	주파수	마이크로- 아키텍처	코어 구성¹	주파수	GFLOPS (FP32)	GFLOPS (FP16)	유형	용량	버스 폭	대역- 폭	사용 가능 여부
T186	덴버2 + Cortex-A57	2 + 4	덴버2: 1.4–2.0 GHz A57: 1.2–2.0 GHz	GP10B (파스칼)^[122]	256:16:16 (2)^[123]	854–1465 MHz	437–750	874–1500	LPDDR4	8 GB	128 비트	59.7 GB/s

¹ 통합 셰이더: 텍스처 매핑 유닛 : 렌더 출력 유닛 (SM 수)

4. 6. 테그라 4i (그레이)

테그라 4i는 휴대폰 및 태블릿용으로 설계된 쿼드 코어 ARM Cortex-A9 CPU 기반의 저전력 프로세서이다.^[221] 테그라 4의 변종으로, Icera i500 LTE/HSPA+ 베이스밴드 프로세서를 통합하여 통신 기능을 강화한 점이 특징이다.^[221]

2013년에 출시되었으며, 주요 특징은 다음과 같다.

CPU: 쿼드 코어 ARM Cortex-A9 R4 (최대 2.3 GHz)^[221]
GPU: 60개 ULP 지포스 코어 (20 버텍스 셰이더 : 40 픽셀 셰이더)^[224]
메모리: 32bit 싱글 채널 LPDDR3-2133^[221]
연산 성능: 단정밀도 36.8 GFLOPS, 배정밀도 13.8 GFLOPS^[222]^[223]
통신: Icera i500 LTE/HSPA+ 통합^[221] (LTE Cat4, HSPA+, TD-HSPA, GSM/GPRS/EDGE 지원)
제조 공정: 28 nm HPM^[221]
화면 해상도: 최대 1920x1200 (LCD), 1920x1080 (HDMI)^[221]
VFPv4 및 NEON (Advanced SIMD) 지원^[221]

테그라 4i는 테그라 4와 테그라 3 사이의 성능을 제공한다.

4. 6. 1. 모델

엔비디아 테그라의 모델별 상세 정보는 다음과 같다.

Tegra 250^[209]
rowspan="2" \|	제조 공정	아키텍처	CPU			GPU		메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭		코어 수	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra APX 2500, 2600		ARM11	1	0.6 GHz	NEON 미지원 (Advanced SIMD)			LPDDR-333	720p@30fps	854x480 (LCD) 1280x1024 (CRT) 1280x720 (HDMI)	없음
Tegra 600				0.7 GHz				LPDDR-333	720p@30fps	1280x1024
Tegra 650				0.8 GHz				LPDDR-400	1080p@24fps	1680x1050
Tegra 230	40 nm^[210]	Cortex-A9	2	1.0 GHz	VFPv3-D16 (VFPv3 대비 레지스터 수 절반) NEON 미지원 (Advanced SIMD)	8 (4 버텍스 셰이더 : 4 픽셀 셰이더)^[211]	단정밀도 5.6 GFLOPS (333 MHz)^[212]	싱글 채널 LPDDR2-600	1080p	1024x600 (LCD) 1280x1024 (CRT) 1920x1080 (HDMI)
Tegra 250	40 nm^[210]	Cortex-A9	2	1.0 GHz	VFPv3-D16 (VFPv3 대비 레지스터 수 절반) NEON 미지원 (Advanced SIMD)	8 (4 버텍스 셰이더 : 4 픽셀 셰이더)^[211]	단정밀도 5.6 GFLOPS (333 MHz)^[212]	싱글 채널 LPDDR2-600, 667	1080p	1680x1050 (LCD) 1600x1200 (CRT)1920x1080 (HDMI)

Tegra 3 / Tegra 4
rowspan="2" \|	제조 공정	아키텍처	CPU					GPU		메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭		연산 성능	L2 캐시	코어 수	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra 3	40 nm^[213]	Cortex-A9	4 + 1^[214]	1.3 - 1.7 GHz	VFPv3 NEON 지원 (Advanced SIMD)	단정밀도 27.2 GFLOPS^[215] 배정밀도 10.2 GFLOPS^[216]	1 MB^[217]	12 (4 버텍스 셰이더 : 8 픽셀 셰이더)^[218]	단정밀도 12.4 GFLOPS（520 MHz^[219]^[220]）	32bit 싱글 채널 LPDDR3-L 1600, LPDDR2-1066	1440p	2048x1536(LCD) 1920x1200(CRT) 1920x1080(HDMI)	없음
Tegra 4i	28 nm^[221]	Cortex-A9 R4		? - 2.3 GHz	VFPv4 NEON 지원 (Advanced SIMD)	단정밀도 36.8 GFLOPS^[222] 배정밀도 13.8 GFLOPS^[223]	1 MB^[217]	60 (20 버텍스 셰이더 : 40 픽셀 셰이더)^[224]	단정밀도 79.2 GFLOPS (660 MHz)^[225]	32bit 싱글 채널 LPDDR3-2133		1920x1200(LCD) 1920x1080(HDMI)	LTE Cat4 HSPA+ TD-HSPA GSM / GPRS / EDGE
Tegra 4	28 nm^[221]	Cortex-A15 r2		1.2 - 1.9 GHz	VFPv4 NEON 지원 (Advanced SIMD)	단정밀도 60.8 GFLOPS^[226] 배정밀도 15.2 GFLOPS^[227]	2 MB + 0.5 MB^[228]	72^[229] (24 버텍스 셰이더 : 48 픽셀 셰이더)^[230]	단정밀도 96.76 GFLOPS (672 MHz^[231])	32bit 듀얼 채널 LPDDR3-L, LPDDR3-1866		3200x2000(LCD) 3840x2160(HDMI)	없음

Tegra K1 / Tegra X1 / Tegra X2
rowspan="2" \|	제조 공정	아키텍처	CPU				GPU			메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭	연산 성능	L2 캐시	코어 수	클럭	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra K1	28 nm^[232] (TSMC HPM)	Cortex-A15 r3	4 + 1	? - 2.3 GHz	단정밀도 73.6 GFLOPS^[233] 배정밀도 18.4 GFLOPS^[234]	2 MB + 0.5 MB^[235]	CUDA Kepler Unified Shader 192 코어	950 MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)	없음
Tegra K1	28 nm^[232] (TSMC HPM)	Denver	2	? - 2.5 GHz^[237]	단정밀도 40 GFLOPS^[238] 배정밀도 20 GFLOPS^[239]	2 MB^[240]	CUDA Kepler Unified Shader 192 코어	950 MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)
Tegra X1^[241]	20 nm (TSMC 20 SoC)	Cortex-A57 + Cortex-A53^[242]	4 + 4^[243]	Cortex-A57 1.9 GHz^[244]	rowspan="2" \|	2 MB + 0.5 MB^[245]	CUDA Maxwell 256 코어^[246]	1024 MHz	단정밀도 512 GFLOPS^[247]	64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s^[248]	H.265, VP9 등 2160p 30fps	4096x2160 60fps
Tegra X1+^[249]^[250]	16 nm	Cortex-A57 + Cortex-A53^[242]	4 + 4^[243]	Cortex-A57 1.9 GHz^[244]	1267 MHz^[251]	2 MB + 0.5 MB^[245]	CUDA Maxwell 256 코어^[246]	단정밀도 649 GFLOPS	64bit LPDDR4X		H.265, VP9 등 2160p 30fps
Tegra X2 (Parker)^[252]	16 nm	Denver 2 + Cortex-A57	2 + 4	2.0 GHz + 2.0 GHz		2 MB + 2 MB	CUDA Pascal 256 코어	1465 MHz	단정밀도 750 GFLOPS	128bit LPDDR4 58.4 GB/s	H.265, VP9 등 2160p 60fps

Xavier / Orin
rowspan="2" \|	제조 공정	아키텍처	CPU					GPU			메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭	연산 성능	L2 캐시	L3 캐시	코어 수	클럭	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Xavier^[253]	12 nm	NVIDIA Carmel Arm®v8.2	8	1.9GHz（Nano） 2.2 GHz（AGX）		6MB^[253]	4MB^[253]	CUDA Volta 384코어 Tensor 48코어（Nano）	1.1 GHz（Nano）	단정밀도 1410 GFLOPS	128bit LPDDR4X 59.7 GB/s	H.265,VP9 등 4K 60fps	3840x2160 60fps
Orin^[255]	8 nm	Cortex®-A78AE v8.2	12	1.5GHz（Nano） 2.2 GHz（AGX)		1.5MB（Nano） 3MB（AGX)	4MB（Nano） 6MB（AGX)	CUDA Ampere 512코어 Tensor 16코어（Nano）	625 MHz（Nano）	단정밀도 0.64 – 5.32 TFLOPS	128bit LPDDR5 102.4 GB/s	H.265,VP9,AV1 등 4K 60fps	3840x2160 60fps

모델	기기
T186	엔비디아 드라이브 PX2 (변형), ZF ProAI 1.1^[124]
T186	엔비디아 젯슨 TX2
	메르세데스-벤츠 MBUX (인포테인먼트 시스템)^[125]
	1개의 유닛과 1개의 GPU 반도체는 2016년 10월부터 모든 테슬라(Tesla, Inc.) 차량의 "테슬라 비전" 기능에 대한 ECU의 일부^[126]^[127]
T186	매직 리프 원(Magic Leap One)^[128]^[129] (혼합 환경 글래스)
	스카이디오 2 (드론)^[130]

'''자비에르(Xavier)''' 테그라(Tegra) SoC는 프로페서 X의 이름을 따서 명명되었으며, 2016년 9월 28일에 발표되었고, 2019년 3월까지 출시되었다.^[131] 70억 개의 트랜지스터, 8개의 커스텀 ARMv8 코어, 512개의 CUDA 코어를 가진 볼타 GPU, DLA(Deep Learning Accelerator)라는 오픈 소스 TPU를 포함하고 있다.^[132]^[133] 칩은 8K 울트라 HD (7680×4320)를 인코딩하고 디코딩할 수 있다. 10 W, 15 W, 30 W TDP에서 작동 모드를 구성할 수 있으며, 다이 크기는 350 mm²이다.^[134]^[135]^[136] 2018년 CES에서 제조 공정이 12 nm FinFET임을 확인했다.^[137]

CPU: 엔비디아 커스텀 카멜(Carmel) ARMv8.2-A (64비트), 8코어 10-와이드 수퍼스칼라^[138]
GPU: 볼타 기반, 1.4 TFLOPS의 512 CUDA 코어;^[139] 유형: GV11B^[140]^[120]
TSMC 12 nm, FinFET 공정
20 TOPS DL 및 160 SPECint @ 20 W; 30 TOPS DL @ 30 W^[136] (TOPS DL = Deep Learning Tera-Ops)
* GPU 기반 텐서 코어를 통해 20 TOPS DL
* DLA 유닛을 통해 10 TOPS DL (INT8), 5 TFLOPS (FP16) 달성^[139]
PVA 유닛(Programmable Vision Accelerator, 스테레오 불일치/광학 흐름/이미지 처리를 위한)^[141]에서 1.6 TOPS
ISP 유닛(이미지 신호 프로세서, 네이티브 풀 레인지 HDR 및 타일 처리 지원)에서 1.5 GPix/s
8k 비디오 지원을 포함한^[135] 1.2 GPix/s 인코딩 및 1.8 GPix/s 디코딩을 위한 비디오 프로세서^[139]
16 레인의 MIPI-CSI-3^[142]^[143]
1 Gbit/s 이더넷
10 Gbit/s 이더넷

모듈	SoC 변형	CPU			GPU					딥 러닝	메모리				채택	TDP (W)
모듈	SoC 변형	프로세서	코어	주파수	마이크로- 아키텍처	코어 구성¹	주파수	TFLOPS (FP32)	TFLOPS (FP16)	TOPS	유형	용량	버스 폭	대역- 폭	사용 가능성	TDP (W)
AGX 자비에르(Xavier) 64 GB		카멜(Carmel) 12 MB 캐시	8	최대 2.2	볼타	512:64 (8, 4, 1)	최대 1377	1.41	2.82	최대 32	LPDDR4X	64 GB	256-비트	136.5 GB/s		10-30
AGX 자비에르(Xavier) 32 GB		카멜(Carmel) 12 MB 캐시	8	최대 2.2	볼타	512:64 (8, 4, 1)	최대 1377	1.41	2.82	최대 32	LPDDR4X	32 GB	256-비트	136.5 GB/s		10-30
AGX 자비에르(Xavier) 산업용		카멜(Carmel) 12 MB 캐시	8	최대 2	볼타	512:64 (8, 4, 1)	최대 1221	1.24	2.48	최대 30	LPDDR4X	32 GB	256-비트	136.5 GB/s		20-40
자비에르(Xavier) NX 16 GB		카멜(Carmel) 10 MB 캐시	6	최대 1.9	볼타	384:48 (6, 3, 1)	최대 1100	0.84	1.69	최대 21	LPDDR4X	16 GB	128-비트	59.7 GB/s		10-20
자비에르(Xavier) NX 8 GB		카멜(Carmel) 10 MB 캐시	6	최대 1.9	볼타	384:48 (6, 3, 1)	최대 1100	0.84	1.69	최대 21	LPDDR4X	8 GB	128-비트	59.7 GB/s		10-20

¹ CUDA 코어 : 텐서 코어 (SM, TPC, GPC)

4. 7. 테그라 K1 (로건)

테그라 K1은 2014년에 출시되었으며, 28nm 공정의 ARM v7 프로세서이다. ARM Cortex-A15(r3) 코어 4개를 탑재하고 있으며, 192코어 케플러 GPU를 사용하여 16/32비트에서 365GFLOPS의 연산 성능을 제공한다.^[236]

Direct3D 12, OpenGL ES 3.1, CUDA 6.5, OpenGL 4.4/4.5, Vulkan을 지원하며, 적응형 확장 텍스처 압축을 지원한다.

4. 7. 1. 모델

테그라 K1 주요 특징
구 분	CPU	GPU	메모리	비디오 인코딩	화면 해상도
32비트	Cortex-A15 r3, 4+1 코어, 최대 2.3 GHz	CUDA Kepler 192 코어, 950 MHz, 단정밀도 365 GFLOPS^[236]	64비트 듀얼 채널 LPDDR3, LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps 지원	3840x2160 (LCD), 4096x2160 (HDMI)
64비트	Denver, 2 코어, 최대 2.5 GHz^[237]	CUDA Kepler 192 코어, 950 MHz, 단정밀도 365 GFLOPS^[236]	64비트 듀얼 채널 LPDDR3, LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps 지원	3840x2160 (LCD), 4096x2160 (HDMI)

^[232]

4. 8. 테그라 X1 (에리스타)

테그라 X1(코드명: 에리스타)은 4개의 ARM Cortex-A57 코어와 4개의 ARM Cortex-A53 코어를 가진 8코어 CPU 구조이다.^[242]^[243] GPU는 맥스웰 아키텍처 기반이며, 적응형 확장 텍스처 압축(ASTC)을 지원한다.^[246]

테그라 X1은 닌텐도 스위치 등 일부 기기에서 오류 주입(FI) 전압 글리칭 공격에 취약하여 임의 코드 실행 및 홈브루 소프트웨어 구현이 가능한 것으로 알려져 있다.

4. 8. 1. 모델

wikitext

Tegra K1 / Tegra X1 / Tegra X2
rowspan="2" \|	제조 공정	아키텍처	CPU				GPU			메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭	연산 성능	L2 캐시	코어 수	클럭	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra K1	28nm^[232] (TSMC HPM)	Cortex-A15 r3	4 + 1	? - 2.3GHz	단정밀도 73.6 GFLOPS^[233] 배정밀도 18.4 GFLOPS^[234]	2 MB + 0.5 MB^[235]	CUDA Kepler Unified Shader 192 코어	950MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)	없음
Tegra K1	28nm^[232] (TSMC HPM)	Denver	2	? - 2.5GHz^[237]	단정밀도 40 GFLOPS^[238] 배정밀도 20 GFLOPS^[239]	2 MB^[240]	CUDA Kepler Unified Shader 192 코어	950MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)
Tegra X1^[241]	20nm (TSMC 20 SoC)	Cortex-A57 + Cortex-A53^[242]	4 + 4^[243]	Cortex-A57 1.9GHz^[244]		2 MB + 0.5 MB^[245]	CUDA Maxwell 256 코어^[246]	1024MHz	단정밀도 512 GFLOPS^[247]	64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s^[248]	H.265, VP9 등 2160p 30fps	4096x2160 60fps
Tegra X1+^[249]^[250]	16nm	Cortex-A57 + Cortex-A53	4 + 4	Cortex-A57 1.9GHz		2 MB + 0.5 MB	CUDA Maxwell 256 코어	1267MHz^[251]	단정밀도 649 GFLOPS	64bit LPDDR4X	H.265, VP9 등 2160p 30fps
Tegra X2 (Parker)^[252]	16nm	Denver 2 + Cortex-A57	2 + 4	+		2 MB + 2 MB	CUDA Pascal 256 코어	1465MHz	단정밀도 750 GFLOPS	128bit LPDDR4 58.4 GB/s	H.265, VP9 등 2160p 60fps

4. 9. 테그라 X2 (파커)

테그라 X2(파커)는 엔비디아가 개발한 모바일 시스템 온 칩(SoC)이다. 16nm 공정으로 제조되었으며, 덴버 2 듀얼 코어 CPU와 ARM Cortex-A57 쿼드 코어 CPU를 결합하여 총 6개의 CPU 코어를 갖추고 있다. 또한, 파스칼 아키텍처 기반의 256개 CUDA 코어를 가진 GPU를 탑재하여 뛰어난 그래픽 성능을 제공한다.^[252]

CPU는 2.0 GHz로 작동하는 덴버 2 코어 2개와 2.0 GHz로 작동하는 Cortex-A57 코어 4개로 구성된다. GPU는 1465 MHz로 작동하며, 단정밀도 연산 성능은 750 GFLOPS, 반정밀도 연산 성능은 1.5 TFLOPS이다. 128bit LPDDR4 메모리를 사용하며, 메모리 대역폭은 58.4 GB/s이다. 비디오 인코딩은 H.265, VP9 등 2160p 60fps를 지원하며, 화면 해상도는 4096x2160 60fps까지 지원한다.^[252]

4. 9. 1. 모델

Tegra K1 / Tegra X1 / Tegra X2
rowspan="2" \|	제조 공정	아키텍처	CPU				GPU			메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭	연산 성능	L2 캐시	코어 수	클럭	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Tegra K1	28nm^[232] (TSMC HPM)	Cortex-A15 r3	4 + 1	? - 2.3 GHz	단정밀도 73.6 GFLOPS^[233] 배정밀도 18.4 GFLOPS^[234]	2 MB + 0.5 MB^[235]	CUDA Kepler Unified Shader 192 코어	950 MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)	없음
Tegra K1	28nm^[232] (TSMC HPM)	Denver	2	? - 2.5 GHz^[237]	단정밀도 40 GFLOPS^[238] 배정밀도 20 GFLOPS^[239]	2 MB^[240]	CUDA Kepler Unified Shader 192 코어	950 MHz	단정밀도 365 GFLOPS^[236]	64bit 듀얼 채널 LPDDR3,LPDDR3-L 14.9 GB/s	H.264, VP8 등 2160p 30fps	3840x2160 (LCD) 4096x2160 (HDMI)
Tegra X1^[241]	20nm (TSMC 20 SoC)	Cortex-A57 + Cortex-A53^[242]	4 + 4^[243]	Cortex-A57 1.9 GHz^[244]	rowspan="2" \|	2 MB + 0.5 MB^[245]	CUDA Maxwell 256 코어^[246]	1024 MHz	단정밀도 512 GFLOPS^[247]	64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s^[248]	H.265, VP9 등 2160p 30fps	4096x2160 60fps
Tegra X1+^[249]^[250]	16nm	Cortex-A57 + Cortex-A53^[242]	4 + 4^[243]	Cortex-A57 1.9 GHz^[244]	1267 MHz^[251]	2 MB + 0.5 MB^[245]	CUDA Maxwell 256 코어^[246]	단정밀도 649 GFLOPS	64bit LPDDR4X		H.265, VP9 등 2160p 30fps
Tegra X2 (Parker)^[252]	16nm	Denver 2 + Cortex-A57	2 + 4	2.0 GHz + 2.0 GHz		2 MB + 2 MB	CUDA Pascal 256 코어	1465 MHz	단정밀도 750 GFLOPS	128bit LPDDR4 58.4 GB/s	H.265, VP9 등 2160p 60fps

Xavier / Orin
rowspan="2" \|	제조 공정	아키텍처	CPU					GPU			메모리	비디오 인코딩	화면 해상도	모뎀
코어 수	제조 공정	아키텍처	클럭	연산 성능	L2 캐시	L3 캐시	코어 수	클럭	연산 성능		메모리	비디오 인코딩	화면 해상도	모뎀
Xavier^[253]	12nm	NVIDIA Carmel Arm®v8.2	8	1.9GHz（Nano） 2.2 GHz（AGX）		6MB^[253]	4MB^[253]	CUDA Volta 384코어 Tensor 48코어（Nano）	1.1 GHz（Nano）	단정밀도 1410 GFLOPS	128bit LPDDR4X 59.7 GB/s	H.265,VP9 등 4K 60fps	3840x2160 60fps
Orin^[255]	8nm	Cortex®-A78AE v8.2	12	1.5GHz（Nano） 2.2 GHz（AGX)		1.5MB（Nano） 3MB（AGX)	4MB（Nano） 6MB（AGX)	CUDA Ampere 512코어 Tensor 16코어（Nano）	625 MHz（Nano）	단정밀도 0.64 – 5.32 TFLOPS	128bit LPDDR5 102.4 GB/s	H.265,VP9,AV1 등 4K 60fps	3840x2160 60fps

4. 10. 자비에 (Xavier)

자비에(Xavier) 테그라 SoC는 만화 캐릭터인 프로페서 X의 이름을 따서 명명되었으며, 2016년 9월 28일에 발표되었고, 2019년 3월까지 출시되었다.^[131]

이 칩은 70억 개의 트랜지스터, 8개의 커스텀 ARMv8 코어, 512개의 CUDA 코어를 가진 볼타 GPU, DLA(Deep Learning Accelerator)라는 오픈 소스 TPU를 포함하고 있다.^[132]^[133] 8K 울트라 HD (7680×4320)를 인코딩하고 디코딩할 수 있다. 사용자는 필요에 따라 10W, 15W, 30W TDP에서 작동 모드를 구성할 수 있으며, 다이 크기는 350 mm²이다.^[134]^[135]^[136] 엔비디아는 2018년 CES에서 제조 공정이 12 nm FinFET임을 확인했다.^[137]

CPU: 엔비디아 커스텀 카멜(Carmel) ARMv8.2-A (64비트), 8코어 10-와이드 수퍼스칼라^[138]
GPU: 볼타 기반, 1.4 TFLOPS의 512 CUDA 코어;^[139] 유형: GV11B^[140]^[120]
TSMC 12 nm, FinFET 공정
20 TOPS DL 및 160 SPECint @ 20 W; 30 TOPS DL @ 30 W^[136] (TOPS DL = Deep Learning Tera-Ops)
GPU 기반 텐서 코어를 통해 20 TOPS DL
DLA 유닛을 통해 10 TOPS DL (INT8), 5 TFLOPS (FP16) 달성^[139]
PVA 유닛(Programmable Vision Accelerator, 스테레오 불일치/광학 흐름/이미지 처리를 위한)^[141]에서 1.6 TOPS
ISP 유닛(이미지 신호 프로세서, 네이티브 풀 레인지 HDR 및 타일 처리 지원)에서 1.5 GPix/s
8k 비디오 지원을 포함한^[135] 1.2 GPix/s 인코딩 및 1.8 GPix/s 디코딩을 위한 비디오 프로세서^[139]
16 레인의 MIPI-CSI-3^[142]^[143]
1 Gbit/s 이더넷
10 Gbit/s 이더넷

4. 10. 1. 모델

(모델)SoC 변형CPU GPU딥 러닝메모리채택TDP (W)프로세서코어주파수
(GHz)마이크로-
아키텍처코어
구성¹주파수
(MHz)TFLOPS
(FP32)TFLOPS
(FP16)TOPS
(INT8)유형용량버스
폭대역폭
(GB/s)AGX 자비에르(Xavier) 64 GB카멜(Carmel) 12 MB 캐시8최대 2.2볼타512:64 (8, 4, 1)최대 13771.412.82최대 32LPDDR4X64 GB256-비트136.5AGX 자비에르(Xavier) 32 GB카멜(Carmel) 12 MB 캐시8최대 2.2볼타512:64 (8, 4, 1)최대 13771.412.82최대 32LPDDR4X32 GB256-비트136.5AGX 자비에르(Xavier) 산업용카멜(Carmel) 12 MB 캐시8최대 2볼타512:64 (8, 4, 1)최대 12211.242.48최대 30LPDDR4X32 GB256-비트136.5자비에르(Xavier) NX 16 GB카멜(Carmel) 10 MB 캐시6최대 1.9볼타384:48 (6, 3, 1)최대 11000.841.69최대 21LPDDR4X16 GB128-비트59.7자비에르(Xavier) NX 8 GB카멜(Carmel) 10 MB 캐시6최대 1.9볼타384:48 (6, 3, 1)최대 11000.841.69최대 21LPDDR4X8 GB128-비트59.7colspan="16" |

제조사	제품
올위너	A-시리즈
애플	애플 실리콘
인텔	아톰
삼성전자	엑시노스
프리스케일 반도체	i.MX
AMD	재규어, 푸마
하이실리콘	K3Vx/Kirin
미디어텍	MTxxxx
ST-에릭슨	노바소어
캐비엄	OCTEON
텍사스 인스트루먼트	OMAP / 시타라 ARM 프로세서
퀄컴	퀄컴 스냅드래곤
르네사스	R-Car
락칩	RK3xxx
브로드컴	비디오코어